2023 H1「中国最具价值 AGI 创新机构 TOP 50」正式发布
从 1950 年图灵测试被首次提出,机器学习概念诞生,到今天,大模型的参数量已达千亿级,以 ChatGPT 为代表的聊天机器人应用,展现了出令人震惊的智能。如果将大模型参数与生物神经元类比一下,AI 用不到 100 年的时间,走完了生物数亿年的进化历程。
大模型驱动之下,各种 AGI 能力飞速涌现,但在抽象的参数背后,依然是具体的人、企业、机构,共同推动了大模型的开发、训练、应用落地。研究基础理论的学者、开发训练模型的工程师、推动应用落地的产品团队……他们才是这个 AGI 时代真正的孕育者,亲手开创了 AGI 行业的新纪元。
在极客公园旗下创业者社区 Founder Park 举办的 AGI Playground 2023 大会上,我们首次发布了 2023 H1「中国大模型创新生态全景图」,致敬大模型领域的先行开拓者,也希望借这一全新视角,思考 AGI 的产业应用价值,与所有人共同参与、见证 AGI 改变世界的进程。
每一次技术的大迭代,都会带来生产力的飞跃,大模型引发的新一轮的工业革命,已近在眼前。但一个炫酷的技术真正想改变世界,需要一套完整的技术生态体系,以弥合世界的复杂性。当前的大模型依旧面临着技术到场景的鸿沟问题,这个时候,我们更需要关注大模型产业价值创新。
因此,Founder Park 评选了 2023 H1「中国最具价值 AGI 创新机构 TOP 50」(AGI MVP TOP 50),联合行业知名专家、机构,从中国大模型生态创新视角切入,涵盖基础设施、模型工具链、大模型、开发工具链、应用范式等多个维度,筛选出 2023 年上半年在技术、商业和行业影响方面表现颇具亮点的创新机构。
以下为 2023 H1 的 AGI MVP TOP 50 和他们的入选理由:
阿里云推出的通义大模型,覆盖了语言、听觉、多模态等领域,衍生出通义千问、通义万相、通义听悟三个基础大模型。
在行业评估框架中,阿里云在平台、服务等多项能力评价下,都取得了领先成绩。未来阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供包括模型训练、推理、部署、精调、测评、产品化落地等在内的全方位服务。
作为常年占据国内搜索市场份额第二,且业务横跨消费者、政企等多个垂直市场的「多栖企业」,360 在 AI 大模型时代看到了广阔的可能性。
基于搜索业务积累的庞大语料库,360 迅速推出了自己的全场景 AI,360 智脑和 360 鸿图。其中包含 360GLM、360GPT 等多个基础大模型,且已围绕大模型开发了图像生成、智能问答、图像修复等数十个细分场景应用,正推向市场。
在 360 的愿景里,AI 的未来在于增量市场,这部分市场并不一定局限在互联网,而是会涵盖方方面面,从个人到企业、行业,甚至城市,都可以有自己专属的 GPT。
作为 AI 领域的头部企业,科大讯飞于 5 月发布了自研的「星火认知大模型」,又在 6 月迅速推出了迭代后的 V1.5 版本。
星火认知大模型拥有文本生成、知识问答、数学能力等 7 项核心能力,能在教育、办公、汽车、数字员工等多个行业、多项场景展开应用。依托讯飞开放平台,科大讯飞已经开放了 560 项 AI 能力,与数百万生态合作伙伴共建 AI 生态。
自 2021 年发布盘古系列预训练大模型以来,华为云一直保持着对 AGI 领域的关注和耕耘。与多数科技巨头选择研究更泛用的「通用大模型」不同,盘古大模型更强调在细分场景的落地应用。
近期,华为云发布了面向行业的盘古大模型 3.0,还详细介绍了华为发展大模型的基础技术能力。盘古大模型 3.0 采用了「5+N+X」三层架构。从基础大模型到细分场景模型,它采用的分层解耦设计,更便于企业用户基于业务需求进行开发、微调,适配更多样的需求,助力千行百业创造更多价值。
北京智源研究院是国内最早面向 AI 领域开展研究的非营利机构,于 2021 年发布了「悟道 1.0」超大规模智能模型。
目前智源研究院旗下有悟道、天演、九鼎等多个 AI 大模型科研项目,以及 FlagOpen 飞智大模型开源系统,共同构成了我国 AI 大模型训练、应用的重要基础设施。
百度的文心大模型,是国内科技巨头里推出时间最早,覆盖领域最广,场景最多的大模型体系之一,旗下涵盖自然语言处理、计算机视觉、跨模态、生物计算、行业大模型五个大类。
据介绍,目前文心大模型已拥有国内最大的产业应用规模。有 15 万家企业申请接入文心一言测试。百度智能云已与 300 多家生态伙伴,在超过 400 个应用场景下取得了不错的测试效果。
早在 ChatGPT 爆火前,MiniMax 就集结了一批对 AGI 怀有信仰的技术理想主义者,使其成为国内最早专注于 AGI 创业的团队之一。成立至今两年不到,MiniMax 从零开始,开发了自己的模型和应用,包括横跨三个模态的基础大模型,具备语音、图像以及文本的多模态生成能力,并在产品侧支持过百万级用户和每天上亿级的调用次数。
由搜狗创始人王小川牵头,成立于今年 4 月的百川智能仅用两个月时间,就完成了自己的「弹射起步」。
6 月,他们推出了 70 亿参数量的中英文预训练大模型——baichuan-7B,不仅在一系列主流中文评估基准测试中取得了优异成绩,还秉承开源精神,对模型权重采用了免费商用协议,为整个大模型开源社区贡献了重要的新力量。7 月刚刚推出的 Baichuan-13B,进一步将参数量提升到了 130 亿,并再次在多项评测中取得领先。
相比其他巨头选择推出一个基础的通用大模型,腾讯云把注意力聚焦在了「行业大模型」上,推出了面向 B 端客户的腾讯云 MaaS 解决方案。
利用其在 B 端领域积累的数据、经验,腾讯云基于基础大模型技术,更具针对性地优化了大模型在应用场景中的实际效果,注重服务最终落地的效果、成本、可靠性。
Zilliz 是向量数据库技术的开创者。这种专门用于存储、索引和查询嵌入向量的数据库系统,可以让大模型更高效率的存储和读取知识库,低成本进行微调,被视为 AI 时代的关键基础设施。
2019 年,Zilliz 开源了全球首个向量数据库产品 Milvus,它在 GitHub 上获得了超过 2 万颗 Star,在全球拥有超过 1000 家企业用户,成为目前全球最流行的开源向量数据库。Zilliz 是 NVIDIA 向量存储的官方合作伙伴,也是 OpenAI ChatGPT plugins 首批插件合作伙伴。
成立于 2021 年,智子引擎是国内较早对多模态大模型展开研究的团队,由人大高瓴人工智能学院教授卢志武担任公司首席技术顾问,
2023 年 3 月,团队发布了自研的 150 亿参数多模态图生文大模型,并推出基于此模型的应用「元乘象 ChatImg 1.0」,能根据图片生成文字描述。后迭代至 2.0 版本,实现了语音交互、视频输入等新功能。
专注于大模型自主创新,智谱 AI 站在了国内基础模型研究领域的最前沿。
团队研发了双语千亿级超大规模预训练模型 GLM-130B,并基于此千亿基座模型推出了对话模型 ChatGLM,同时开源了单卡版模型 ChatGLM-6B,全球下载量超过 400 万。智谱 AI 践行 Model as a Service(MaaS)的市场理念,打造高效率、通用化的「模型即服务」AI 开发新范式,为国内大模型的发展垒下了一块坚实基座。
西湖心辰背靠中国新型研究型大学「西湖大学」,积极探索打造「高智商 +高情商」,更懂人心的 AI 大模型。
西湖心辰也是国内最早推出一系列 2C 产品的大模型公司之一,产品包括 AI 写作助手「Friday」、上线月余迅速积累百万用户的 AI 绘画产品「造梦日记」,以及更早推出的 AI 心理咨询助手「小天」。近期,西湖心辰正式推出自研的通用大模型——「西湖大模型」,其能在不同场景下满足社交、情感、陪伴、支持等多种需求,形成更深度的互动。
HiDream.ai 由前京东副总裁梅涛创办,致力于围绕视觉,打造生成式多模态基础模型及应用,并将生成的内容融入营销、设计等垂直应用场景。公司目前已经在训练 60 亿参数的视觉模型,以 Stable Diffusion 和 Midjourney 为目标,计划在年内让模型参数量突破百亿。
作为推出国内第一款「云端协作设计工具」的 SaaS 企业,即时设计在 AGI 浪潮中再次第一时间把握了时代脉搏。2023 年 3 月 推出了 AI 设计工具「即时 AI」,支持通过自然语言描述生成可二次编辑的 UI 设计稿。产品推出当月就吸引了超 10 万人申请内测。在 5 月初开启公测后,更成为全球首款全面开放的同类产品。即时设计对 AI 时代下设计工具的探索不止于此,接连推出 AI 绘图产品「即时灵感」、设计稿一键转代码能力的「即时上线」,以及每周都在迭代进化的「即时 AI」,这些都让人们看到了它的创新力。
面壁智能基于多年大模型训练经验,构建了 CPM 通用大模型、 CPM 领域大模型,最新模型 CPM-Bee 具备多种细分能力。同时公司还推出了 OpenBMB 大模型开源社区,持续推动大模型技术的工具化和应用落地。
2023 年 4 月,面壁智能与知乎联合研发了首个中文大模型「知海图 AI」,并推出应用「热榜摘要」,为中文大模型的开发、应用贡献了重要力量。
成立于 2019 年,超参数科技是国内最早入局 AGI 的创业公司之一。团队自 2015 年起,先后开发了包括围棋 AI「绝艺」、王者荣耀 AI「绝悟」在内的一系列 AI 应用。
超参数科技相信,AI 不只是一种技术、工具、解决方案,而是一种新的生命形态。基于此理念,他们描绘了一条从 L1 - L4 的 AI 技术路径,从单个的拟人 AI,最终会发展成 AI 社会、AI 世界。今年 3 月,超参数科技发布了 GAEA,一个拥有 AI NPC 生态能力的,永续运转的「AI 社会」雏形。
由百度创始人李彦宏发起成立,百图生科研发了生物计算大模型 xTrimo。xTrimo 面向复杂生命科学问题,是生命科学领域起步最早、规模最大的多模态预训练大模型之一,实现了蛋白质发现等一系列突破性任务。
通过整合前沿的疾病生物学、生物信息学、抗体工程、人工智能、传感与自动化技术,百图生科希望基于生物计算大模型,打造一套全新的药物研发平台,加速突破创新药物的研发进程,助力生物医药领域加速发展。
深耕语音交互领域十余年,出门问问一直保持着对「自然语言交互」的专注。现在,生成式 AI 为它提供了一个全新变量。
凭借在消费场景多年积累的 AI 能力和经验,出门问问已经推出了包括魔音工坊、奇妙元在内的 AIGC 平台,并推出了自研大模型「序列猴子」,同时面向消费者、企业和创作者,提供「一站式」的 AI 内容生成解决方案,在内容生成 AI 领域占据了领先地位。
面向企业端市场,衔远科技希望通过 AI 技术帮助企业实现从数字到实体的融合。
团队自主研发了通用 AI 大模型,在具备通用能力的基础上,更擅长理解人与商品,通过 ProductGPT 为企业与消费者以生成式人工智能帮助从商品洞察、定位、设计、研发到营销的创新。同时基于多模态能力提高商品场景高效率切换及营销转化,助力企业实现业务增长价值。
聆心智能孵化自清华大学,致力于打造新一代「安全、可控、拟人」的超拟人大模型,并以此建立大模型支撑的应用生态。
基于超拟人大模型底座打造的 AI,不仅能够拥有「情感」,还能具备「智慧」,用户可以根据个人偏好创造不同性格与人设的 AI 角色,与之实现高度自由的互动聊天,同时赋能包括教育、汽车、营销、游戏、直播等多种场景,提供人性化与智能化兼具的服务。
通过钻研「稀疏计算」技术,墨芯人工智能希望破解大模型时代的算力难题。
它开发的云端和终端 AI 芯片加速方案通过优化计算模式,能将神经网络开发全面稀疏化,提供超高算力、超低功耗的通用 AI 计算平台,降低成本,为大模型应用打开一片更广阔的空间。
澜舟科技以自然语言处理技术为基础,致力于开发下一代「认知智能平台」。
目前,澜舟科技已推出了「孟子预训练模型」,并基于此模型打造了一系列功能引擎,涵盖搜索、生成、翻译、对话等多个语言文字场景。
深言科技致力于大模型及新一代智能信息处理系统研发,团队由清华大学与北京智源人工智能研究院共同孵化,旨在打造基于大规模预训练模型的新一代智能文本信息处理平台,涵盖 AIGC 文本生成、信息抽取聚合、语义检索等功能,为数亿脑力劳动者和数千万信息密集型组织重塑信息处理全流程。
合成数据是解决大模型数据短缺的最有效办法之一。光轮智能致力于为企业落地 AI 提供合成数据解决方案,结合生成式 AI 和仿真技术,为行业提供 3D、物理真实、可泛化的合成数据,解决自动驾驶、具身智能发展中真实数据利用率低、标注成本高、回环周期长、长尾场景(Corner Case)缺乏的问题。
光轮通过算力驱动的数据来替代现有人力驱动的数据,将数据边际成本变为固定成本,推动数据界结构性变革。
粤港澳大湾区数字经济研究院(IDEA 研究院)由沈向洋博士担任理事长,旗下认知计算与自然语言研究中心致力于在预训练大模型时代建设认知智能的基础设施,推动 AI 学术和产业发展。
自 2021 年成立以来,IDEA 研究院推出了「封神榜」大模型并在预训练模型生产、少样本/零样本学习、受控文本生成、自动化机器学习等多个技术领域都达到了领先水平。
过去一年,「封神榜」团队推出了中文开源 Stable Diffusion 模型「太乙」,并研发了开源通用大模型「姜子牙系列」,为 AIGC 开源社区贡献了关键力量。
成立于今年 4 月,光年之外前期的起步过程并非完全一帆风顺,但团队的脚步从未停止。
目前光年之外已经完成了以技术和产品人才为主的团队搭建,吸引了多名 AI 领域专家加入。6 月,光年之外被美团以 20.65 亿元人民币收购,这意味着它能持续保持优秀的团队建制,加速在 AGI 领域探索前进。
以「解放 AI 生产力」为使命,潞晨科技推出了通用、高效,且易于训练部署的深度学习系统 Colossal-AI。
利用 Colossal-AI 的算法技术,他们推出了对应的企业版 PaaS 平台,能帮助中小企业实现小型化模型部署,提升计算效率,节省大模型的调用成本,降低大模型落地门槛。
深势科技致力于将 AI 技术与多尺度模拟仿真算法结合,打造新一代微尺度工业设计和仿真平台,构建微观尺度工业基础设施,已推出 Bohrium® 微尺度科学计算云平台、Hermite® 药物计算设计平台和 RiDYMO™ 强化动力学平台等研究工具,颠覆了现有研发模式。
年初深势联合 AISI 发布了首个覆盖元素周期表近 70 种元素的深度势能原子间势函数预训练模型 DPA-1;7 月又推出了 Uni-RNA 预训练模型。通过大模型技术,为 RNA 领域的深度研究创新提供了更好的工具。
必优科技以智能写作、文档生成与排版为核心产品,顺应 AGI 时代浪潮,迅速推出了多个相关大模型产品。
其中包括面向人力资源行业的伯乐大模型、面向营销行业的商贾大模型、面向办公领域的图笏大模型,并已将它们应用于 AI 简历辅写、PPT 生成、商品营销文案等多个垂直应用场景。
针对 AGI 时代图形计算的开发需求,太极图形分布在全球的团队主导开发了「太极编程语言」,在 GitHub 斩获了 23.5K stars。开源的太极编程语言大大提高了并行编程的生产力,降低了开发者学习、应用计算机图形学的软硬件门槛,应用场景涵盖 AIGC、AR/VR、机器人学等诸多领域,已被全球百余所企业和高校采用。
近期太极图形与合作伙伴推出了全球首款实时 3D-AIGC-UGC 的 MMO 手游,并上线了 3D AIGC 工具箱 Meshy AI,其凭借强悍的智能图形学能力,成为 AIGC 3D 方向最值得关注创新公司之一。
ZMO.AI 是一款针对营销内容的生成式 AI 服务。用户只需要上传一张产品图,就可以自动生成不同风格的营销物料,包括宣传图、促销海报等,并可以生成多个选项,在投放过程中对比数据。
产品上线后迅速突破百万用户,且用户付费意愿强烈。使其成为生成式 AI 领域产品化、商业化成功的优秀案例。
创立于 2023 年 3 月,生数科技核心成员开源了全球首个基于 Transformer 的多模态扩散大模型 UniDiffuser,该模型能高质量地完成文生图、图文联合生成、改写等多种生成任务,并进而已实现领先的 3D 生成和视频生成效果。
目前生数科技正研发产业级的多模态生成式大模型,探索生成式 AI 在艺术设计、游戏制作、内容社区等场景的应用,提升人类的生产力与创造力。
TIAMAT 希望通过自研算法、底层引擎、平台,为用户提供 AI 图像生成服务。
其自研的 MorpherVLM 是国内首个基于概念融合范式提出的近百亿级跨模态生成模型,通过异构的视觉编解码网络结构,提高了模型对图像多尺度信息的建模能力和对用户 prompt 的理解能力。
光线云成立于 2021 年,专注图形渲染技术研发,致力于打造云原生的实时渲染引擎,团队成员多来自浙江大学 CAD&CG 国家重点实验室。
为了探索更高效的 3D 渲染模式,光线云很早就开始了「AIGC+ 渲染引擎」的技术布局,基于深度学习算法,可以快速、灵活地生成不同模态的渲染内容,能广泛应用于游戏、影视、虚拟人等内容开发领域。
脱胎于清华大学智能技术与系统国家重点实验室,灵动音科技希望利用 AI 技术降低音乐的创作、制作门槛,为音乐行业提供新的产品体验。
其已推出了包括和弦派、口袋乐队、BGMCAT 等多个生成式 AI 工具,能实现自动作词、作曲、编曲、演唱、混音等一系列功能。
心识宇宙打造了 AGI 应用平台 MindOS,致力于推动生成式 AI 从生成内容,逐渐进化为人格化的软件、服务。
他们自主研发的「全脑自主性 Agent 框架」能赋予 AI 思考、情感、记忆及多场景智能服务的能力,并在多种场景下服务和陪伴用户,同时可与现有 App、网页或小程序进行深度整合,成为企业更智能、更高效的全新服务交互界面。
基于自主研发的云计算架构、音视频编解码等技术,蔚领时代搭建了一套业界领先的云游戏平台。在此基础上,他们正利用 AI 技术,进一步驱动游戏内容的开发、创作。
蔚领时代 AI Lab 团队目前已在利用 AI 大模型,探索游戏设计和实现的新范式,在 3D 建模、场景生成和和角色制作、NPC 驱动与游戏逻辑开发、游戏场景和资产优化等多方面展开探索,降低制作成本、缩短周期,增强游戏的表现力,推动云游戏产业进步。
行者 AI 专注于 AI 在游戏领域的研究应用,依托自研算法模型,已推出了 AI bot 玩家、AI 内容审核、AI 美术、音乐等多个 AIGC 产品,共同形成了面向游戏开发商的全链路解决方案。
其全线 AIGC 产品都采用 SaaS 的方式进行交付,对中小型游戏开发者最大程度降低了使用门槛,提升效率,实现赋能。
作为我国 AI 领域的新型科研机构,上海人工智能研究室肩负着「突破技术」、「引领发展」的重要责任。
自成立后,其已推出 DeepLink 人工智能开放计算体系、书生·天际(LandMark)千亿参数 NeRF 模型训练与 100 平方公里 1K 分辨率模型的实时渲染、书生·浦语(InternLM)计算与通信高效重叠等研究成果。
Jina Al 是一家的人工智能软件公司,其自研的基于多模态技术的 AIGC 工具包,包括提示词开发工具 PromptPerfect、图片内容描述工具 SceneX 和多模态大型语言模型服务 JinaChat,目前已得到全球累计超 20 万用户的信赖,满足不同业务场景需求。其 Jina、DocArray 等开源项目受到了全球开发者的支持,多次登上 GitHub 排行榜首位。
作为 AI 领域的行业先驱,创业近 10 年来,第四范式推出了多种 AI 解决方案,已广泛应用于金融、零售、制造、能源、电信、医疗等领域。
2023 年 4 月,第四范式首次对外发布了其大模型产品「式说 3.0」,其定位为基于多模态大模型的新型开发平台,以生成式 AI 重构企业软件,提升企业软件的体验和开发效率。
自 2015 年创办至今,竹间智能一直以情感计算为核心,探索多模态人机交互技术,将 AI 能力整合到企业业务中。
目前竹间已推出对话式 AI 平台,知识工程平台、 AICC+ 解决方案平台、自然语言处理平台、自动化机器学习平台等多个核心工具,提供智能客服、企业助手、数字人等产品,解决方案覆盖金融、医疗、制造等多个领域。
商汤科技在 AI 领域有着深厚技术积累,一直身处 AI 研究、应用前沿。
2023 年 4 月,商汤科技对外发布了「日日新 SenseNova」大模型体系,展示了该模型在自然语言生成,图片视频内容生成,以及 3D 建模实时交互上的能力。为打造自研大模型,商汤历时五年,建设了业界领先的 AI 大装置,共有 27000 块 GPU,可以输出 5.0 exaFLOPS 的总算力,是亚洲目前最大的智能计算平台之一。
影眸科技孵化于上海科技大学,通过与国内顶尖人工智能、计算机视觉实验室合作,积极推动实验室科研成果的民用化、商业化,探索前沿人工智能、计算机视觉技术在大众娱乐市场的推广应用,推出了穹顶光场毛孔级扫描服务与 3 天打造超写实数字人流程,以及 HYPERHUMAN 3D 角色生成平台,旨在打造以 AIGC 为核心逻辑的元宇宙时代数字身份系统。
月之暗面由清华大学交叉信息研究院助理教授杨植麟创立,专注于 AGI 大模型开发,成立后迅速获得红杉资本、真格基金等一线 VC 支持。
创始人杨植麟曾以第一的成绩毕业于清华大学,后赴卡内基梅隆大学研究自然语言处理,曾任职于 Meta、Google 等巨头旗下的 AI 实验室,在 NLP、AI 领域具有丰富的学术和开发经验。
GPU 芯片是 AGI 时代最重要的硬件基础设施。沐曦致力于为异构计算提供全栈 GPU 芯片及解决方案,核心团队成员平均拥有近 20 年 GPU 产品研发经验。目前沐曦已推出的 GPU 产品包括 AI 推理 GPU「曦思」、AI 训练及通用计算 GPU「曦云」和图形渲染 GPU「曦彩」,能为 AGI 大模型企业提供关键的算力基石。
成立于 2015 年,云从科技通过自研打造的人机协同操作系统(CWOS),已实现了产品化落地,成为第一家在科创板上市的 AI 平台公司。
进入 AGI 时代,云从科技进一步将数据要素整合,开始了对视觉、语音、自然语言等多个领域的大模型探索实践。目前已推出的「从容大模型」,具备文字生成、问答,以及撰写代码能力。
零一万物由创新工场 CEO 李开复博士领衔带队,寓意「从零到一,乃至宇宙万物」。公司将自研大模型、自建平台,并计划在 AI 2.0 时代发展出「七大模块技术路线」。
正如 NVIDIA 创始人黄仁勋所说,「AI 的 iPhone 时刻已经到来」。就在此刻,下一代参数规模更大、层数更多的大模型正在不分昼夜的学习、训练,新的应用想法也正萌发生长。随着更多人开始进行 AI-native 的思考,更多人力、算力投入这场革命,我们相信,这只是一个开始。作为极客公园旗下科技创业者社区,Founder Park 会持续关注新锐创新力量,与创业者一起,解锁 AGI 时代的更大能量。
如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。